La dimensión de salud mide que tan informados se encuentran las Medellinenses sobre los métodos de planificación familiar y que tanto hacen uso del sistema de salud de la ciudad.
Para la el análisis de la dimensión de SALUD en los barrios de Medellín se toman las siguientes preguntas con sus respectivos indicadores, estas preguntas son seleccionadas a la luz de descubrir si las condiciones de la dimensión aporta a la calidad de vida de los habitantes de los barrios de Medellín:
Posibles respuestas:
* 99 No responde
* 88 No aplica
* 1 Si
* 2 No
Indicador: Porcentaje de personas que consideran que tienen suficiente información sobre los métodos de planificación familiar
Fórmula: Cantidad de personas que consideran que tienen suficiente información sobre los métodos de planificación familiar / Total de personas encuestadas
Posibles respuestas:
* 99 No responde
* 88 No aplica
* 1 Si
* 2 No
Indicador: Porcentaje de personas que planifican (1)
Fórmula: Cantidad de personas que planifican / Total de personas encuestadas
Posibles respuestas:
* 99 No responde
* 88 No aplica
* 1 Si
* 2 No
Indicador: Porcentaje de personas que en los últimos 30 días han tenido algún problema de salud y no haya necesitado hospitalización (1)
Fórmula: Cantidad de personas que en los últimos 30 días han tenido algún problema de salud y no haya necesitado hospitalización / Total de personas encuestadas
Posibles respuestas:
* -99 No responde
* -98 No sabe.
* -88 No aplica
* -77 Otro
* 1 Consultó la Red de servicios de salud.
* 2 Acudió a una terapia alternativa.
* 3 Acudió a un boticario o farmaceuta
* 4 Consultó a un tegua, empírico, curandero, yerbatero, comadrona, etc.
* 5 Usó remedios caseros
* 6 Se automedicó
* 7 Nada
Para efectos del indicador se toma la opción 1. Consultó la Red de servicios de salud. para calcular el indicador, ya que esta opción mide que tanto uso se le da a la red.
Indicador: Porcentaje de personas que consultan a la red de servicios de salud cuando tienes problemas de salud
Fórmula: Cantidad de personas que consultan la red de servicios de salud / total de personas encuestadas
Posibles respuestas:
Indicador: Porcentaje de personas que no solicitaron o no recibieron atencion médica por mal servicio. Considerando mal servicio las opciones 5,6,7,8. Este indicador busca medir como persiven y que experiencia han tenido los hogares en este aspecto, el cual es vital para la calida de vida.
Fórmula: Cantidad de personas que no solicitaron atención médica o no la recibieron por mal servicio / total de personas encuestadas
Posibles respuestas:
Indicador: Porcentaje de personas que utilizan servicios de promocion y prevención.
Fórmula: Cantidad de personas que utilizaron los servicios de promoción y prevención / Total de persoans encuestadas
El insumo principal de este trabajo son los datos abiertos del portal Medata[1] y en particular la Encuesta de Calidad de Vida Medellín Cómo vamos.
Estadisticas básicas VIVIENDA Y SERVICIOS PUBLICOS
## comuna barrio p_307 p_308
## EL POBLADO : 22 SAN PABLO : 3 Min. :0.2500 Min. :0.1068
## ROBLEDO : 22 EL LLANO : 2 1st Qu.:0.7282 1st Qu.:0.2406
## BELEN : 21 EL SALADO : 2 Median :0.7704 Median :0.2948
## SAN CRISTOBAL: 20 LA ESPERANZA: 2 Mean :0.7642 Mean :0.3045
## SAN JAVIER : 19 LA FLORIDA : 2 3rd Qu.:0.8102 3rd Qu.:0.3491
## VILLA HERMOSA: 18 LA PALMA : 2 Max. :1.0000 Max. :1.0000
## (Other) :185 (Other) :294 NA's :5
## p_324 p_325 p_326 p_327
## Min. :0.01786 Min. :0.01786 Min. :0.00112 Min. :0.005831
## 1st Qu.:0.11278 1st Qu.:0.08106 1st Qu.:0.00601 1st Qu.:0.096812
## Median :0.14472 Median :0.10895 Median :0.01078 Median :0.135198
## Mean :0.15021 Mean :0.11212 Mean :0.01439 Mean :0.141253
## 3rd Qu.:0.18029 3rd Qu.:0.13523 3rd Qu.:0.01583 3rd Qu.:0.165094
## Max. :0.57143 Max. :0.30769 Max. :0.19048 Max. :0.500000
## NA's :14 NA's :17 NA's :129 NA's :14
Existen valores nulos dentro del dataframe, analizando cuales de ellos son debido a que no respondieron ninguna de las preguntas de la encuesta relacionadas a Salud, se encuentra que los nulos no son debido a que no quisieron responder la encuesta completa en temas de salud, sino que personas que no quisieron contestar alguna pregunta particular y por lo tanto las demás son insumo para el análisis.
## [1] encuesta persona comuna barrio estrato p_15 p_307
## [8] p_308 p_324 p_325 p_326 p_327
## <0 rows> (or 0-length row.names)
Para efectos de la ejecución de los modelos y demás anás, los valores del data frame ECV_SALUD_BARRIO que sean nulos se llenan con 0 dado que cuando se presenta un valor NAN significa que el indicador no aplica para el barrio y el cero lo representa
La matriz de correlación muestra la relación existente entre las preguntas p_324 y p_325, la cuales corresponden a ¿En los últimos 30 días, tuvo alguna enfermedad, accidente, problema odontológico, o algún otro problema de salud que no haya implicado hospitalización? y ¿Para tratar ese problema de salud, que hizo principalmente?, respectivamente.
Con aras de determinar si las preguntas seleccionadas en la dimensión aportan al futuro modelo de agrupamiento, se busca reducir las preguntas a aquellas que representen más en el análisis, esto se realiza a través del modelo de componentes principales (PCA)
De aquí los 2 primeros componentes se destacan antes de que haya una caída notable en la varianza
Ahora, revisemos cuales preguntas estan contribuyendo a cada uno de esos 2 componentes, seleccionando de cada componente las 6 preguntas contribuyentes
Seleccionamos las preguntas que contibuyan en más de un 20% en cada uno de los componentes, las cuales equivalen a las siguientes preguntas:
Con estas nueva selecció de preguntas, procederemos a realizar el agrupamiento
Si bien, la mayoria de los indicadores del dataframe ECV_SALUD_BARRIO se encuentran en función de personas para evitar cualquier dato erroneo por efectos de cambios en escala, se normalizan los datos
Se utilizan diferentes métodos para determinar el k óptimo a utilizar en el algoritmo de clusterización - Kmeans
Método del codo
Diferencia entre los errores generados con diferentes k
Dado que para los diferentes métodos de determinación del k óptimo, hay dos posibles opciones, k =2 y k = 4, se ejecuta el algoritmo con estos posibles valores y se tomará aquel que ajuste mejor el modelo.
## [1] "Total SS k=2: "
## [1] 1.947243
## [1] "Total SS k=4: "
## [1] 3.704737
Con k = 4 el modelo ajuste mejor, hay cluster más heterogeneos, por lo tanto se toma éste como el número de k para el modelo
Según el algoritmo, se generaron 4 grupos distribuidos de la siguiente forma :
## # A tibble: 4 x 2
## cluster barrios
## <int> <int>
## 1 1 11
## 2 2 88
## 3 3 125
## 4 4 79
Visualizando los grupos
Análisis para cada uno de los grupos
Grupo 1
## comuna barrio p_307
## PALMITAS :3 BARRIO COLOMBIA :1 Min. :0.8000
## SAN CRISTOBAL:3 BARRO BLANCO :1 1st Qu.:0.8735
## SANTA ELENA :2 BATALLÓN GIRARDOT :1 Median :0.9138
## ALTAVISTA :1 BOQUERÓN :1 Mean :0.9211
## EL POBLADO :1 CABECERA ALTAVISTA:1 3rd Qu.:1.0000
## VILLA HERMOSA:1 LA ALDEA :1 Max. :1.0000
## (Other) :0 (Other) :5
## p_308 p_324 p_325 cluster
## Min. :0.4840 Min. :0.00000 Min. :0.00000 Min. :1
## 1st Qu.:0.5408 1st Qu.:0.00000 1st Qu.:0.00000 1st Qu.:1
## Median :0.5625 Median :0.09859 Median :0.09859 Median :1
## Mean :0.6183 Mean :0.13766 Mean :0.09799 Mean :1
## 3rd Qu.:0.6137 3rd Qu.:0.16795 3rd Qu.:0.14834 3rd Qu.:1
## Max. :1.0000 Max. :0.57143 Max. :0.30769 Max. :1
##
El 92% de las personas encuestadas que pertenecen a este grupo tienen suficiente información sobre plnaificación familiar y el 61% en promedio planifican, el 13% de las personas se enfermaron en los últimos días antes de realizarle la encuenta.
Grupo 2
## comuna barrio p_307
## ARANJUEZ :10 SAN PABLO : 2 Min. :0.6000
## LA CANDELARIA :10 AGUAS FRÍAS : 1 1st Qu.:0.7468
## VILLA HERMOSA : 8 ALFONSO LÓPEZ : 1 Median :0.7728
## SANTA CRUZ : 7 ALTAVISTA CENTRAL: 1 Mean :0.7734
## DOCE DE OCTUBRE : 6 ALTOS DEL POBLADO: 1 3rd Qu.:0.8063
## LAURELES-ESTADIO: 6 ANDALUCIA : 1 Max. :0.9395
## (Other) :42 (Other) :82
## p_308 p_324 p_325 cluster
## Min. :0.1466 Min. :0.1220 Min. :0.07879 Min. :2
## 1st Qu.:0.2266 1st Qu.:0.1690 1st Qu.:0.12009 1st Qu.:2
## Median :0.2648 Median :0.1905 Median :0.14286 Median :2
## Mean :0.2622 Mean :0.2020 Mean :0.15030 Mean :2
## 3rd Qu.:0.2919 3rd Qu.:0.2215 3rd Qu.:0.16558 3rd Qu.:2
## Max. :0.4157 Max. :0.4810 Max. :0.30556 Max. :2
##
El 77% de las personas encuestadas que pertenecen a este grupo tienen suficiente información sobre plnaificación familiar y solo el 20% en promedio planifican, el 20% de las personas se enfermaron en los últimos días antes de realizarle la encuenta y el 15% buscaron la red de servicios de salud.
Grupo 3
## comuna barrio p_307
## ROBLEDO :14 NARANJAL : 2 Min. :0.5631
## SAN JAVIER :13 ALDEA PABLO VI : 1 1st Qu.:0.7518
## CASTILLA : 9 ALEJANDRO ECHAVARRÍA: 1 Median :0.7932
## EL POBLADO : 9 ALTAMIRA : 1 Mean :0.7869
## MANRIQUE : 9 ALTAVISTA : 1 3rd Qu.:0.8221
## SAN CRISTOBAL: 9 ANTONIO NARIÑO : 1 Max. :0.9794
## (Other) :63 (Other) :119
## p_308 p_324 p_325 cluster
## Min. :0.2417 Min. :0.0000 Min. :0.00000 Min. :3
## 1st Qu.:0.3163 1st Qu.:0.1106 1st Qu.:0.07475 1st Qu.:3
## Median :0.3446 Median :0.1334 Median :0.09949 Median :3
## Mean :0.3550 Mean :0.1295 Mean :0.09508 Mean :3
## 3rd Qu.:0.3822 3rd Qu.:0.1581 3rd Qu.:0.11556 3rd Qu.:3
## Max. :0.5238 Max. :0.2305 Max. :0.22857 Max. :3
##
El 78% de la población que respondió esta encuesta dice tener suficiente información sobre los métodos de planificación familiar y el 35% de ellos planifican. El último mes se enfermaron en promedio 12% de la poblaciún y el 9% asisitio a la red de salud.
Grupo 4
## comuna barrio
## BELEN :13 EL LLANO : 2
## EL POBLADO : 9 LA PALMA : 2
## LA AMERICA : 8 ALEJANDRÍA : 1
## SAN CRISTOBAL : 7 ÁREA DE EXPANSIÓN ALTAVISTA : 1
## BUENOS AIRES : 6 AREA EXPANSION SAN ANTONIO DE PRADO: 1
## LAURELES-ESTADIO: 6 BARRIO CRISTÓBAL : 1
## (Other) :32 (Other) :73
## p_307 p_308 p_324 p_325
## Min. :0.2500 Min. :0.0000 Min. :0.00000 Min. :0.00000
## 1st Qu.:0.6538 1st Qu.:0.1857 1st Qu.:0.06965 1st Qu.:0.04651
## Median :0.7140 Median :0.2236 Median :0.10617 Median :0.07884
## Mean :0.6977 Mean :0.2112 Mean :0.10131 Mean :0.07507
## 3rd Qu.:0.7575 3rd Qu.:0.2541 3rd Qu.:0.13248 3rd Qu.:0.09677
## Max. :1.0000 Max. :0.3400 Max. :0.22581 Max. :0.18987
##
## cluster
## Min. :4
## 1st Qu.:4
## Median :4
## Mean :4
## 3rd Qu.:4
## Max. :4
##
El 69% de la población que respondió esta encuesta dice tener suficiente información sobre los métodos de planificación familiar y el 21% de ellos planifican. El último mes se enfermaron en promedio 10% de la poblaciún y el 7% asisitio a la red de salud.
Conozcamos algunos barrios que pertenecen a cada uno de estos grupos
## [1] "Grupo 1"
## [1] "CABECERA ALTAVISTA, BARRIO COLOMBIA, LA ALDEA, POTRERA MISERENGA, VOLCANA GUAYABAL, BOQUERÓN, LA ILUSIÓN, SAN JOSE DE LA MONTAÑA, BARRO BLANCO, MAZO, BATALLÓN GIRARDOT"
## [1] "Grupo 2"
## [1] "AGUAS FRÍAS, ALTAVISTA CENTRAL, ÁREA DE EXPANSIÓN BELÉN RINCÓN, SAN PABLO, ARANJUEZ, BASILIA, BERMEJAL- LOS ÁLAMOS, CAMPO VALDÉS Nº 1, LA PIÑUELA, LAS ESMERALDAS, MANRIQUE CENTRAL Nº 1, SAN ISIDRO, SAN PEDRO, SEVILLA, LA GLORIA, LAS MERCEDES, LOS ALPES, MIRAVALLE, SAN BERNARDO, LA ASOMADERA Nº 3, MIRA FLORES, OCHO DE MARZO, ALFONSO LÓPEZ, GIRARDOT, TEJELO, DOCE DE OCTUBRE Nº 2, EL TRIUNFO, LA ESPERANZA, PEDREGAL, PICACHO, PROGRESO Nº 2, ALTOS DEL POBLADO, ASTORGA, MANILA, CRISTO REY, CALAZANS PARTE ALTA, EL DANUBIO, FERRINI, LA AMÉRICA, LA FLORESTA, BOMBONA Nº 1, BOSTON, CORAZÓN DE JESÚS, EL CHAGUALO, ESTACIÓN VILLA, JESÚS NAZARENO, LAS PALMAS, LOS ÁNGELES, SAN BENITO, VILLA NUEVA, BOLIVARIANA, CARLOS E RESTREPO, ESTADIO, LORENA, LOS COLORES, LOS CONQUISTADORES, CAMPO VALDES Nº 2, EL POMAR, MANRIQUE ORIENTAL, SAN JOSE LA CIMA Nº 2, SANTA INES, LA FRISOLA, URQUITA, GRANIZAL, MOSCU Nº 2, SAN PABLO, VILLA GUADALUPE, CÓRDOBA, LA PILARICA, OLAYA HERRERA, VILLA FLORA, LA CUCHILLA, BETANIA, EL SALADO, ANDALUCIA, EL PLAYON DE LOS COMUNEROS, LA FRANCIA, MOSCU Nº 1, PABLO VI, SANTA CRUZ, VILLA NIZA, ENCISO, LA MANSIÓN, LLANADITAS, LOS MANGOS, SUCRE, VILLA HERMOSA, VILLA LILIAM, VILLA TINA"
## [1] "Grupo 3"
## [1] "BUGA PATIO BONITO, EL JARDÍN, BERLÍN, MIRANDA, MORAVIA, PALERMO, ALTAVISTA, LA HONDONADA, LAS VIOLETAS, ALEJANDRO ECHAVARRÍA, BARRIO CAYCEDO, BARRIOS DE JESÚS, BOMBONA Nº 2, CATALUÑA, LA ASOMADERA Nº 2, LORETO, LOS CERROS EL VERJEL, BELALCAZAR, BOYACÁ, CASTILLA, FLORENCIA, HÉCTOR ABAD GÓMEZ, LAS BRISAS, PROGRESO, TOSCANA, TRICENTENARIO, MIRADOR DEL DOCE, PICACHITO, SAN MARTÍN DE PORRES, SANTANDER, CASTROPOL, EL CASTILLO, EL DIAMANTE Nº 2, EL TESORO, LAS LOMAS Nº 2, LOS BALSOS Nº 2, LOS NARANJOS, SAN LUCAS, VILLA CARLOTA, GUAYABAL, LA COLINA, SAN PABLO, BARRIO COLON, LA CANDELARIA, SAN DIEGO, LA CASTELLANA, NARANJAL, SURAMERICANA, EL RAIZAL, LA CRUZ, LA SALLE, LAS GRANJAS, MANRIQUE CENTRAL Nº 2, MARIA CANO - CARAMBOLAS, ORIENTE, SAN JOSELA CIMA Nº 1, VERSALLES Nº 2, LA SUIZA, SECTOR CENTRAL, ALDEA PABLO VI, CARPINELO, EL COMPROMISO, LA AVANZADA, LA ESPERANZA Nº 2, POPULAR, SANTO DOMINGO SABIO Nº 1, SANTO DOMINGO SABIO Nº 2, ALTAMIRA, AURES Nº 1, AURES Nº 2, BARRIO FACULTAD DE MINAS, BOSQUES DE SAN PABLO, CERRO EL VOLADOR, CUCARACHO, EL DIAMANTE, MONTECLARO, NUEVA VILLA DE LA IGUANA, PAJARITO, ROBLEDO, SAN GERMÁN, SANTA MARGARITA, CABECERA SAN ANT DE PR., EL SALADO, LA FLORIDA, MONTAÑITA, YARUMALITO, AREA DE EXPANCION SAN CRISTOBAL, AREA EXPANSION PAJARITO, CABECERA SAN CRISTÓBAL, CIUDADELA NUEVO OCCIDENTE, LA LOMA, LAS PLAYAS, NARANJAL, PEDREGAL ALTO, TRAVESÍAS, ANTONIO NARIÑO, BELENCITO, BLANQUIZAL, EDUARDO SANTOS, EL CORAZÓN, EL PESEBRE, EL SOCORRO / LA GABRIELA, JUAN XXIII - LA QUIEBRA, LA PRADERA, LAS INDEPENDENCIAS, METROPOLITANO, NUEVOS CONQUISTADORES, SANTA ROSA DE LIMA, LA FRONTERA, LA ISLA, LA ROSA, VILLA DEL SOCORRO, EL CERRO, LAS PALMAS, PIEDRA GORDA, PIEDRAS BLANCAS, SANTA ELENA SECTOR CENTRAL, EL PINAL, LA LADERA, LA LIBERTAD, LA SIERRA, LAS ESTANCIAS, SAN ANTONIO, SAN MIGUEL, TRECE DE NOVIEMBRE, VILLA TURBAY"
## [1] "Grupo 4"
## [1] ÁREA DE EXPANSIÓN ALTAVISTA EL CORAZÓN EL MORRO
## [3] LA ESPERANZA SAN JOSÉ DEL MANZANILLO
## [5] BELÉN CERRO NUTIBARA
## 299 Levels: AGUAS FRÍAS ALDEA PABLO VI ALEJANDRÍA ... YARUMALITO
Características que distinguen un grupo de barrios de otro
El grupo 1 se diferencia de los demás porque es el que en promedio dice tener suficiente información sobre los métodos de planificación familiar y son los que más planifican, el grupo 2 se identifica por ser los que en promedio en los últimos 30 dí se enfermaron sin necesidad de hospitalización y asistieron a la red de servicios de salud, el grupo 4 se caracteriza porque en promedio tiene menor aplicación en todos los indicadores de esta dimensión, por su parte el grupo 3 es un grupo cuyo compartamiento es intermedio.
3. Análisis espacial
Se cargan las subdivisiones territoriales de Medellín, tomadas de la página web de opendata[2]
## OGR data source with driver: ESRI Shapefile
## Source: "/Users/yosel/Desktop/Especializacion/AprendizajeEstadistico/Agrupamiento/Taller 01/TAE_T1/dataSet/Barrio_Vereda/Barrio_Vereda.shp", layer: "Barrio_Vereda"
## with 332 features
## It has 6 fields
## Integer64 fields read as strings: OBJECTID SUBTIPO_BA
Se procede a dibujar el mapa de Medellín señalando cada uno de los barrios a que cluster pertenece